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(1. 中 国 科学 院 西双版纳 热带 植物 园 , 云南 E 666303:2. 中 国 科 学 院 大 学 , 北京 100049; 

3. 西南 林业 大 学 园林 园艺 学 院 ， 昆 明 650224) 
摘 XE. WM= (Paphiopedilum parishi) 分 布 范 围 狭 窗 ， 仅 在 中 国 、 缅 甸 、 泰 国 以 及 老 
挝 有 少量 分 布 。 近 年 由 于 生境 破坏 和 人 为 滥 采 导致 球 带 久 兰 野生 种 群 极度 缩减 。 遗传 多 样 性 
代表 着 物种 适应 环境 和 生存 发 展 的 能 力 , 保存 珍稀 濒危 物种 的 遗传 多 样 性 是 物种 保护 的 重要 
目标 ， 但 际 带 兜 兰 的 遗传 信息 还 不 清楚 。 该 研究 对 球 带 兜 兰 4 个 野生 个 体 经 测序 、 组 装 、 注 
释 获 得 的 叶绿体 基因 组 序列 , 与 已 公开 的 另外 2 个 个 体 的 叶绿体 全 基因 组 序列 进行 比较 ,分 
析 种 内 差异 。 结 果 表 明 : (1) 球 带 兜 兰 叶绿体 基因 组 具有 典型 被 子 植物 叶绿体 基因 组 环 状 四 
Sid 基因 组 长 度 为 154 403-154 809 bp， 共 编码 129 个 基因 ,包括 78 个 蛋白 质 编码 基 
. 39 个 tRNA 基因 、8 4 rRNA 基因 ， 以 及 4 个 假 基 因 。(2) 在 飘带 狗 兰 6 个 个 体 叶绿体 
me 103-107 个 SSRs (simple sequence repeats) 位 点 ， 其 中 21 个 SSR 位 点 具有 
多 态 性 。 此 外 ，6 个 个 体 叶绿体 基因 组 中 还 检测 到 60 个 长 序列 重复 ， 包 括 17~21 个 正 向 重 
复 ，18~29 个 反 向 重复 ，9~16 个 回 文 重复 ，4~9 个 互补 重复 。(3) 通过 比较 6 个 个 体 叶绿体 
基因 组 序列 的 核 背 酸 多 样 性 ， 共 发 现 70 处 变异 ， 包 括 10 个 SNPs (single nucleotide 
polymorphism) 以 及 60 个 插入 缺失 (InDels)。 其 中 有 3 个 SNP 位 点 发 生 了 非 同 义 替 换 ， 导 
致 编码 功能 基因 的 氨基 酸 发 生 改 变 ;19 个 插入 缺失 多 态 性 较 高 ， 具 有 开发 为 分 子 标记 的 潜 
力 。(4) 通过 计算 核 痛 酸 多 样 性 值 (P) 共 发 现 8 个 有 变异 的 区 域 ，P; 值 为 0~0.00632， 其 
中 变异 度 较 大 的 是 rps3 -rpD22.. trnL-UAC-TpI32. rpoB- trnC-GCA 以 及 ycH， 这 些 高 变 区 
可 开发 为 分 子 标记 用 于 评估 陶 带 久 兰 遗传 多 样 性 。(5) 系统 发 生 分 析 结 果 表 明 ， 飘 带 兜 兰 6 
个 个 体 叶绿体 基因 组 序列 聚 在 一 起 , 与 长 办 忽 兰 互 为 姐妹 群 。 综 上 所 述 ， 蒜 带 忽 兰 叶 绿 体 基 
因 组 的 SSRs、 长 序列 重复 、SNPs、InDels 以 及 核 苷 酸 序列 呈现 了 足够 的 种 内 多 样 性 ， 可 开 
发 成 分 子 标记 用 于 该 种 的 系统 演化 及 保护 生物 学 研究 。 
关键 词 : 叶绿体 全 基因 组 ， 味 带 兜 兰 ， 序 列 差异 ， 多 态 性 分 子 标 记 ， 插 入 缺失 ， 微 卫星 
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Abstract: Paphiopedilum parishii is a rare and endangered species with few localities and 
fragmented populations found in China, Myanmar, Thailand and Lao. Environmental changes and 


over-harvesting have led to a decrease in its wild populations. It is important to protect endangered 
基金 项 目 ， 国 家 自然 科学 基金 (31870183, 32270225) [Supported by National Natural Science Foundation of 
China (31870183, 32270225)]. 

作者 简介 : mm (1997-)， 硕 士 ， 研 究 方向 为 保护 生物 学 ，(E-maiD gaoxinzhen()xtbg.ac.cn. 

* 通 信 作 者 : 罗 艳 ， 博 士 ， 研 究 员 ， 研 究 方向 为 兰 科 植物 多 样 性 与 保护 ，(E-maiD luoyan@xtbg.org.cn。 


pt 


species' genetic diversity since it provides the species with the ability to adapt and survive. 
However, little is known about the genetic information of this species. This study aims to detect 
intraspecific variation and develop polymorphic genetic markers of P. parishii. The complete 
chloroplast genome of four individuals of wild P. parishii was obtained by sequencing, 
assembling and annotating, then compared with the existing genomic data of two individuals 
available from GenBank to detect the intraspecific variation. Further, simple sequence repeats 
(SSRs), single nucleotide polymorphisms (SNPs), and insertions and deletions (InDels) were 
identified. The results were as follows: (1) The four new sequencing chloroplast genomes were 
quadripartite, with a length between 154 403 bp and 154 809 bp, with 129 genes (78 protein 
coding genes, 39 tRNAs, 8rRNAs and 4 pseudogenes). (2) As a result of comparison of six 
individuals, 103-107 SSR loci were identified in the chloroplast genome of six individuals of P. 
parishii, and 21SSRs were polymorphic. And 60 long repeats were found, including 17-21 
forward repeats, 18-29 reverse repeats, 9-16 palindromic repeats, and 4-9 complement repeats. (3) 
In addition, a total of 10 SNPs and 60 InDels were uncovered across the plastome. Three of the 
non-synonymous mutations caused amino acid changes in functional domains. 19 InDels might be 
selected for possible chloroplast DNA markers to determine intraspecific variation. (4) The value 
of nucleotide diversity (P;) was calculated ranging from 0-0.006 32 suggesting sequences with 
low variation. Hyper-polymorphic regions, e.g. intergenic spacers rps3-rpl22, trnL-UAC-rpl32, 
rpoB-trnC-GCA and ycfA gene were identified as potential barcoding regions. (5) The 
phylogenetic analyses based on the complete chloroplast genome supported three lineages in 
Paphiopedilum, and 6 individuals of P. parishii form a monophyletic group. SSRs, long repeats, 
InDels, SNPs and nucleotide sequences showed sufficient intraspecific genetic variation in P. 
parishii. The molecular markers developed here will contribute to further evolutionary studies and 
conservation of P. parishii. 

Key words: Chloroplast genome, Paphiopedilum parishii, sequence divergence, polymorphic 
DNA markers, InDels, SSRs 


遗传 多 样 性 是 生物 多 样 性 的 基础 ， 代 表 着 物种 适应 环境 和 生存 发 展 的 能 力 ， 保 存 珍 稀 濒 
和 危 物 种 的 遗传 多 样 性 是 物种 保护 的 重要 目标 (Guerrant & Pavlik, 1998; 黄 宏文 , 2018)。 叶 绿 
体 是 植物 细胞 内 进行 光合 固 碳 和 胁迫 应 答 的 重要 半 自 主 遗 传 细 胞 器 , 植物 叶绿体 基因 组 为 环 
状 DNA 分 子 ， 单 亲 遗 传 ， 基 因 组 大 小 为 107~218 kb， 基 因 结 构 和 组 成 稳定 ( 张 韵 洁 和 李 德 
铁 , 2011; Ivanova et al., 2017)。 叶 绿 体 基因 组 通常 为 四 分 体 结构 ， 包 括 两 个 反问 重复 序列 
(inverted repeat, IR) 、 一 个 大 单 找 贝 区 (large single copy region, LSC) 和 一 个 小 单 找 贝 区 
(small single copy region, SSC) (Wolfe et al., 1987; 田 欣 和 李 德 铁 , 2002; Jansen et al., 2005; 5| 
韵 洁 和 李 德 铁 , 2011; He et al., 2019)。 叶 绿 体 基 因 组 编码 110~130 个 基因 ， 主 要 包括 光合 从 
用 相关 和 叶绿体 基因 表达 相关 的 基因 等 ( 张 韵 洁 和 李 德 铁 , 2011)。 叶 绿 体 基 因 组 虽然 较 小 ， 
晶 包 含有 大 量 遗 传 信息 , 在 核 音 酸 序列 水 平和 结构 重 排 上 呈现 出 进化 与 保守 性 ,编码 区 和 非 
和 码 区 有 不 同 进化 速率 ,在 分 子 水 平 上 有 明显 差异 ， 可 用 于 区 分 种 间 关 系 、 评 估 种 间 变 异性 
等 , 被 广泛 用 于 群体 遗传 多 样 性 、 系 统 演化 等 研究 领域 (Wolfe et al., 1987; SKI fus fl ek, 
2011; He et al., 2019; 黎 若 竹 等 , 2022)。 近 年 来 , 利用 种 内 不 同 个 体 叶绿体 基因 组 的 种 内 变异 ， 
为 物种 进化 研究 、 种 质 资源 利用 以 及 濒危 植物 保护 提供 了 基础 遗传 信息 (Ishizuka et al., 2017; 
Muraguri et al., 2020; Zhang et al., 2020b) 。 

9825] (Paphiopedilum) 为 兰 科 构 兰 亚 科 (Orchidaceae, subfamily Cypripedioideae) fti 17, 
J 80 余 种， 主要 分 布 于 亚洲 至 太平 洋 岛 屿 的 热带 亚热带 地 区 的 石灰 岩山 地 (Cribb, 1998; 
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颖 婕 等 , 2021)。 近 年 来 ， 由 于 兜 兰 属 植物 的 自然 生境 局 限于 生态 环境 脆弱 的 喀斯特 地 区 ， 


人 类 活动 导致 的 生态 退化 和 生境 破坏 严重 ， 加 之 过 度 采 挖 ， 使 得 兜 兰 属 植物 野生 种 群 数量 
部 分 兜 兰 属 植物 面临 野外 灭绝 的 风险 ( 罗 角 波 等 , 2003; 杨 颖 婕 等 ,2021)。 目前 ， 


急剧 减少 , 部 
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种 类 均 被 列 入 《濒危 野生 动 植物 


国际 贸易 公约 》 ee on 


International Trade in Endangered Species of Wild Fauna and Flora, CITES) 禁止 贸易 ， 同 时 我 
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兜 兰 属 植物 也 全 部 列 入 《国家 重点 保护 野生 植物 名 录 》(2021 年 9 月 颁布 实 


施 )。 我 国 野生 兜 兰 属 物种 的 濒危 机 制 与 保护 工作 急需 开展 。 
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(Paphiopedilum parishii ) 为 附 生 兰 科 植物 ， 生 于 海拔 1 000~1 100 m 的 树干 或 


石头 上 , 为 我 国 一 级 重点 保护 植物 (图 1)。 殊 带 久 兰 被 世界 自然 保护 联盟 (International Union 


for Conservation of Nature, IUCN) 评估 为 濒危 等 级 (Endangered, ER)， 仅 在 我 国 云南 南部 、 
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的 观赏 价值 ,在 各 植物 
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加 和 老挝 分 布 有 少数 的 野生 种 群 (Rankou & Averyanov, 2015). Wir 98-5 EUR Bes 
园 中 均 有 引种 , 但 野生 种 群 已 经 极为 罕见 。Chen 等 (2012) 在 云南 南 
带 忽 兰 繁殖 生物 学 的 观察 , 发 现 该 种 具有 独特 的 自动 授粉 机 制 。 基于 叶绿体 全 基 


因 组 的 发 育 基 因 组 学 的 研究 ， 飘 带 忽 兰 属于 忽 兰 亚 属 (subgenus Paphiopedilum) (Guo et al., 
2021). 1H H BI 2E Vit 98-5 
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的 遗传 信息 仍 不 完善 ， 尚 缺乏 评估 遗传 多 样 性 及 种 内 多 样 性 的 


本 研究 选取 球 带 兜 兰 的 
组 , 并 与 已 公开 的 该 种 2 个 个 体 叶绿体 基因 组 (Guo et al., 2021; Kao et al., 2021) 进行 基因 组 
比较 研究 ,分 析 球 带 兜 兰 叶绿体 基因 组 的 种 内 变异 , 理解 肚 带 兜 兰 的 基因 进化 水 平和 遗传 多 


样 性 ， 以 期 开发 


开展 综合 保护 。 


! 内 多 态 性 的 分 子 标记 月 


4 个 野生 个 体 , 进行 浅 层 基因 组 测序 , 组 装 获 得 其 叶绿体 全 基因 


au 


于 保护 生物 学 研究 , JIA REN 96 75 BA HUS LU 


T 


物种 保护 研究 提供 遗传 信息 基础 资料 。 
1 材料 与 方法 
1.1 研究 材料 及 DNA 提取 、 测 序 


M 
TES 


parishii _ 
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1 采 自 云南 省 动 腊 县 (P parishii 1 & P parishi 2) 及 澜 沧 县 (P 
3 和 P. parishii 4) 两 个 野生 居 群 (图 DJ)， 取 新 鲜 叶 片 放 入 硅胶 中 干燥 。 采 用 植物 基 


因 组 DNA 提取 试剂 盒 (TIANGEN, 中国 北京 ) 提取 叶片 总 DNA, 使 用 IlluminaTruSeq 文库 


派 森 诺 生 物 科 
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进行 比较 基因 


建立 试剂 盒 (San Diego, CA, USA) 构建 测序 文库 , 利用 Humina Hiseq 2500 测序 平台 (上 海 


技 有 限 公司 ) 进行 浅 层 基因 组 测序 。 同 时 ,在 GenBank 上 下 载 已 公开 的 另外 2 
体 的 叶绿体 基 
组 分 析 。 


因 组 序列 (P. parishii 5, MW528213 和 P. parishii 6, MN587822) 


A. 生境 ; 


Cs Mrs 
L. JE 


B. 结果 植株 ;C. 开花 植株 ，D. 花 部 结构 图 ; 
E. dt. 


Ds. 中 苯 P. EI; S. 合 莹 片 ，Co. Att; 


A. Habitat; B. Fruiting individual; C. Flowering individual; D. Dissected flower; Ds. Dorsal sepal; P. Petals; S. 


Synsepals; Co. 


Column; L. Lip; E. Flower. 


图 1 8v su 
Fig. 1 Paphiopedilum parishii 


1.2 叶绿体 基因 组 的 组 装 与 注释 


M 


采用 Fastp 软 伯 


data) 后 ， 


F 对 下 机 后 的 原始 数据 (raw data) 进行 过 滤 ， 获 得 高 质量 测序 数据 (clean 
] GetOrganelle v1.6.3 程序 将 测序 后 得 到 的 数据 组 装 成 叶绿体 基因 组 (Jin et al., 


2018)。 组 装 完成 后 的 叶绿体 基因 组 数据 用 Geneious Prime v2021.2.2 中 的 MAFFT 工具 进行 


比 对 后 ， 使 


在 线 工 具 CPGAVAS2 (http://47.90.241.85:16019/analyzer/annotate2) (Shi et al., 
2019), GeSeq (https://chlorobox.mpimp-golm.mpg.de/geseq.html) (Tillich et al., 2017) 和 
tRNA-scan-SE v2.0.3 (Lowe & Chan, 2016) 对 叶绿体 基因 组 的 蛋白 质 编 


码 区 、 核 糖 体 RNA 


(rRNA) 和 转运 RNA (RNA) 进行 注释 ,参考 已 发 表 的 兜 兰 属 叶绿体 基因 组 对 注释 结果 进行 
校正 。 最 后 通过 OGDRAW (https://chlorobox.mpimp-golm.mpg.de/OGDraw. html) 在 线 网 站 绘 
叶绿体 基因 组 图 谱 (Lohse et al., 2007)。 使 用 Geneious Prime 2021.2.2 软件 分 析 6 
叶绿体 基因 组 的 基本 结构 ， 统 计 LSC、SSC HIR 的 长 度 、GC 含量 、 蛋 白质 编 
码 基因 、tRNA 基因 、rRNA 基因 数目 。 
1.3 叶绿体 基因 组 重复 序列 与 SSR 分 析 


制 陨 带 匈 兰 


LIES 


通过 MISA 在 线 网 站 (https://webblast.ipk-gatersleben.de/misa) (Beier et al., 2017) 测算 叶 


绿 体 基因 组 中 简单 重复 序列 (simple sequence repeats, SSR) 的 分 布 ， 将 核 苷 酸 最 小 重复 数 分 


别 设置 为 10 (FER 


E^ mono-nucleotide)、5 ( — FE tT 3E f di-nucleotide)、4 (三 核 苷 酸 


EH tri-nucleotide). 3 (ZEREA tetra-nucleotide). 3 (RIZ TF E f. penta-nucleotide). 3 
(六 核 背 酸 重复 hexa-nucleotide) . 


DE 


通过 REPuter (https://bibiserv.cebitec.uni-bielefeld.de/reputer) (Kurtz et al., 2001) 在 线 网 站 
叶绿体 基因 组 中 其 他 重复 序列 的 分 布 ， 参 数 设置 为 最 小 重复 序列 30 bp， 汉 明 距 离 


(Hamming Distance) 设置 为 3 (Liang et al., 2019). 
1.4 种 间 叶 绿 体 基 因 组 的 比较 分 析 


的 叶绿体 基 


含 子 区 进行 比 对 分 析 ， 评 佑 各 基因 组 序列 之 间 的 相似 性 和 差异 。 使 


通过 mVISTA (https://genome.Ibl.gov/vista) 在 线 网 站 (Frazer et al., 2004)， 以 Pparishii 1 


因 组 作为 参考 ,将 其 余 5 条 飘带 兜 兰 的 叶绿体 基因 组 的 纺 


码 区 、 基 因 间 隔 区 、 内 
HR v4.0.2 软件 运行 


IRscope (Amiryousefi et al., 2018) 脚本 ， 对 6 个 个 体 的 叶绿体 基因 组 序列 的 相 邻 边界 区 域 进 


cti 


酸 变 异 值 (P). 
1.5 系统 发 育 分 析 


从 GenBank E F 15 种 兜 兰 属 叶绿体 全 基因 组 序列 ， 与 本 下 
的 2 条 飘带 兜 兰 叶 绿 体 基因 组 序列 , 以 3 


以 及 已 发 表 


1， 比较 分 析 边 界 区 域 的 扩张 和 收缩 情况 。 使 用 DnaSP v5.10.0.1 HAF, ti Suit 98-5 
不 同 个 体 间 的 序列 的 单 核 苷 酸 变异 (SNPs) fud 


Fi 入 缺失 (InDels) 情况 ， 计 算 各 序列 间 核 音 


究 新 测序 拼装 的 4 个 个 体 
! 构 兰 属 植物 为 外 类 群 来 构建 系统 发 育 


树 (物种 的 基因 登录 号 见 图 5))。 使 用 PhyloSuite v1.2.2 软件 ， 利 用 ModelFinder 计算 最 佳 碱 


基 蔡 换 模型 


(Zhang et al., 2020a), 使 


叶绿体 基因 组 全 序列 , 经 MAFFT 进行 多 序列 比 对 后 ， 


采用 IQ-TREE 构建 最 大 似 然 法 (maximum likelihood, ML) 系统 发 育 树 (Trifinopoulos et al., 


2016)， 系 统 发 育 树 分 支 的 支持 率 基 于 bootstrap 自 展 法 检测 ，bootstrap 值 设 置 为 5000， 重复 


1 000 次 。 


2 结果 与 分 析 


2.1 际 带 忽 兰 叶绿体 基因 组 基本 特征 


对 原始 数据 进行 过 滤 后 ， 球 带 兜 兰 
装 和 注释 的 叶绿体 全 基因 组 序列 已 登 3 
本 研究 将 获得 的 飘带 兜 兰 


4 个 个 体 和 已 公布 的 2 83 


至 GenBank (登录 


条 序列 的 叶绿体 基因 组 均 为 环 状 四 分 体 结构 ， 包 括 LSC 区 ， 


绿 体 基因 组 序列 全 长 为 154 403~154 809 bp, 


号 分 


4 个 样品 分 别 获得 2.4~3.1 G 的 高 质量 clean data。 组 
|J OP 604356~OP 604359)。 
带 兜 兰 叶 绿 体 基因 组 一 起 比 对 分 析 ，6 


SSC 区 和 两 个 IR 区 (图 2)。 叶 


其 中 LSC 的 长 度 为 86 581-86 983 bp，SSC 的 
长 度 为 2 436~2 446 bp, IR 的 长 度 为 32 690-32 693 bp。 总 GC 含量 为 33.9%，LSC 的 GC 


含量 为 33.4%，SSC 的 GC 含量 为 29.1%~29.2%，IR 的 GC 含量 为 39.5% (X 1)。 


Slo 6 个 个 体 叶绿体 基因 组 的 基因 


个 基因 在 IR 区 重复 ， 具 有 2 个 找 贝 ， 


rrn4.5 .rrn5).18 个 基因 


有 内 含 子 , 其 中 15 个 基因 
petD .atpF »ndhB ,rpoC1 »rpsl6 .rp12 ,rp116、accD) 和 6 个 tRNA 基因 
trnl-GAU, trnK-UUU, trnL-UAA. trnV-UAC); 有 2 个 基因 


rps12 为 反 剪 接 基因 (附录 1). 
表 1 Bui 9E 6 个 个 体 叶绿体 基因 组 基本 特征 


Table 1 The basic characteristics of the chloroplast genomes of six Paphiopedilum parishii 


| 基因 组 特征 


Genome characteristics 


序列 全 长 Genome size (bp) 

LSC 区 长 度 LSC length (bp) 

区 长 度 SSC length (bp) 

IR 区 长 度 IR length (bp) 

GC 含量 GC content (96) 

| LSC [X GC 含量 GC content of LSC (96) 
SSC [X GC 含量 GC content of SSC (94) 

IR [X GC 

CDS [X G 

tRNA [X GC 含量 GC content of tRNA (96) 


含量 GC content of IR (96) 
CH 


含量 GC content of CDS (%) 


rRNA [X GC 含量 GC content of rRNA (96) 


基因 总 数 Total genes 


假 基 因数 Pseudogene 
编码 蛋白 基因 数 No. of CDS 
tRNA 基因 数 No. of tRNA genes 


rRNA 基因 数 No. of rRNA genes 


P. parishii 1 
(OP604356) 
154 809 

86 983 

2 446 
32 690 

35.9 

33.4 

29.1 

39.5 

37.5 

53.2 

55.2 

129 


包括 9 NEAR, 
rps19. rpl2 , rpI23. ycfl ~ ycf2). 9 个 tRNA 基因 
trnL-CAA , trnL-UAG、 trnN-GUU, trnR-ACG, trnV-GAC) 和 4 个 rRNA 基 
有 1 个 内 含 子 ,包括 9 个 和 蛋 


总 数 均 为 129 个 ， 包 括 78 个 蛋白 质 编 码 基因 、 
39 个 tRNA 基因 、8 个 rRNA 基因 ， 以 及 4 个 假 基 因 (ndhJ. ndhD. 2 个 ycf15) (附录 1). 22 
adt] (psaC. ndhB. rps7、 rpsl5. 


(trnA-UGC , trnH-GUG , trnI-CAU, trnl-GAU, 


individuals 
P. parishii 2 P. parishii 3 
(OP604357) (OP604358) 
154 660 154 809 
86 834 86 983 
2 446 2 446 
32 690 32 690 
35.9 35.9 
33.4 33.4 
29.2 29.1 
39.5 39.5 
37.5 37.5 
53.2 53.2 
55.2 55.2 
129 129 
4 4 
78 78 
39 39 
8 8 


因 (rrn16、 rrn23. 


含有 2 个 内 含 子 (cpP、ycP); 


P parishii 4 
(OP604359) 
154 403 
86 581 
2436 
32 693 
35.9 
33.4 
29.2 
39.5 
355 
53.2 
55.2 
129 


P. parishii 5 
(MW528213) 
154 689 
86 863 
2 446 
32 690 
35.9 
33.4 
29.2 
39.5 
37.5 
53.2 
55.2 
129 


编码 基因 (petB，、 
(trnA-UGC ,trnG-UCC , 


P. parishii 6 
(MN587822) 
154 692 
86 866 
2 446 
32 690 
35.9 
33.4 
292 
39.5 
37.5 
532 
55.2 
129 
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Wat go 25 ARE ATH "n EE 
Paphiopedilum parishii kc 
chloroplast genome — 
154 403-154 809 bp a 


[3 NADH dehydrogenase 

EFA OAI] RubisCO large subunit 
WISI RNA polymerase 

村 Ribosomal proteins (SSU) 

4] Ribosomal proteins (LSU) 


NA Hp] Ribosomal RNAs 
ip tK 

Bl Hih Other genes 
RNET 


:网 Hypothetical chloroplast reading frames (yc/) 


图 2 Sui EERE AA Ee 
Fig.2 Chloroplast genome map of Paphiopedilum parishii 


2.2 SSR 位 点 分 析 
利用 MISA 软件 在 飘带 忽 兰 6 个 体 的 叶绿体 基因 组 中 分 别 检测 到 103~107 个 SSR 位 点 ， 


包括 47-51 个 单 核 音 酸 重复 (主要 以 A,T 碱 基 重 复 为 主 )、20 个 二 核 苔 酸 重复 、15 个 三 核 音 


酸 重 复 、 
2). SSR 


位 点 (图 


14 个 四 核 苷 酸 重复 、2 个 五 核 苷 酸 重复 以 及 5 个 六 核 背 酸 重复 类 型 (图 3: A,， 附录 
位 点 大 部 分 位 于 LSC 区 (84-88 个 )， 其 次 IR 区 分 布 有 18 ~19 个 ，SSC 区 无 SSR 
3:B)。 另 外 ,SSR 位 点 主要 分 布 于 叶绿体 基因 组 非 编码 区 的 基因 间隔 区 (Intergenic 


Spacer, IGS)， 为 72~ 76 个 ; 位 于 基因 内 含 子 区 (ntron) 的 有 17 个 ; 位 于 编码 区 的 有 14 个 
(图 3:C, 3: D). 

Teu 9825 6 个 个 体 同 源 区 域 的 SSR 位 点 进行 详细 的 比较 ， 筛 选 出 具有 相同 类 型 但 重 
复数 目 不 同 的 SSR 位 点 ， 可 作为 种 内 多 态 性 位 点 ， 共 发 现 21 个 SSR 位 点 在 6 个 个 体 中 有 
差异 ( 表 2)。 


表 2 BUE Uu 6 个 个 体 中 存在 的 多 态 性 SSR 位 点 


Table 2 The polymorphic simple sequence repeats (SSR) in the chloroplast genomes of six 


Paphiopedilum parishii individuals 


SSR 类 型 
SSR type 


A 


Od d d d ddud»ddnud»»nuindu 


» 


TA 
GGAAGA 


[m 
J 


Hs 数字 代表 重复 个 数 。 
Note: Number indicated SSR repeats. 


P. parishii l/P. parishii 2/P. parishii 3/ 
P. parishii A/P. parishii 5/P. parishii 6 
0/0/0/10/0/0 
11/0/11/0/0/0 
17/5/17/20/15/15 
10/0/10/10/0/0 
10/11/10/0/11/11 
0/0/0/10/0/0/0 
10/0/10/0/0/0 
10/0/10/0/0/0 
12/10/12/14/10/10 
0/10/0/10/10/10 
0/10/0/10/10/10 
15/14/15/10/19/20 
23/0/23/24/24/24 
10/10/10/0/10/10 
12/12/12/0/12/12 
10/0/10/0/0/0 
15/12/15/10/12/12 
10/10/10/0/10/10 
8/8/8/6/8/8 
9/9/9/11/9/9 
6/6/6/5/6/6 


位 置 


Location 


trnK-UUU 
trnK-UUU-rpsl6 
atpF 
atpH-atpl 
atplI-rps2 
petN-psbM 
trnL-UAA-trnF-GAA 
trnF-GAA-ndhJ 
atpB-rbcL 
rbcL-accD 
petA-psbJ 
trnP-UGG-psaJ 
trnP-UGG-psaJ 
clpP 
clpP 
rpl36-infA 
rpl14-rpll6 
trnl-GAU 
trnE-UUC-trnT-GGU 
psbB-psbT 


yg 


区 域 
Region 
Intron 
IGS 
Intron 
IGS 
IGS 
IGS 
IGS 
IGS 
IGS 
IGS 
IGS 
IGS 
IGS 
Intron 
Intron 
IGS 
IGS 
Intron 
IGS 
IGS 
CDS 
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B NATREL 国 -HEMER 
A Hexanucleotide repeats Trinucleotide repeats 
[ Ees XU URSI 


git Number 


C 


[m Tetranucleotide repeats 


Pentanucleotide repeats 


eot Dinucleotide repeats 
四 核 苷 酸 重复 


El TECHN SR T 


Mononucleotide repeats 


5 5 


5 


P. parishii | 
P. parishii 2 
P. parishii 3 
P. parishii 4 
P. parishii. 
P. parishi 


Bl 蛋白 编码 区 CDS 
E] 基因 间隔 区 IGS 
EJ] i & IX Intron 


P. parishii 6 


P. parishii 5 


P. parishii 4 


P. parishii 3 


P. parishii 2 


P. parishii 1 


A. 不 同类 型 重复 单元 的 数量 ，B. SSR 位 点 在 叶绿体 基因 组 大 单 拷贝 


重复 区 (IR) 的 数量 ，C. SSR 位 点 在 CDS，IGS ，Intron 区 域 的 数量 ; 


0 20 40 60 80 100 120 


grhit Number 


IGS，Intron 区 域 不 同 重复 类 型 的 数量 分 布 。 
A. Numbers of SSRs in different types; B. Numbers of SSRs in the LSC (large single copy), SSC (small single 


Ai! Number 
D 


s] 
[- 


o. 
e 


ES 
è 


PEGES R8 


Bl Kn se 


P. parishii 6 


P. parishii 5 
P. parishii_4 
P. parishii _3 


P. parishii_2 


P. parishii l 
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100 


0 20 40 60 80 
数量 Number 
六 核 首 酸 重复 [m] —Bato s 
Hexanucleotide repeats ‘rinucleotide repeats 
| EX M MATRE 
Pentanucleotide repeats Dinucleotide repeats 
gb smsu p sme 
Tetranucleotide repeats Mononuclcotide repeats 


IGS 


CDS Intron 


P. parishi 
P. parishi 
P. parishi 


P. parishi 
P. parishi 
P. parishii 


P. parishii 1 
P. parishii 2 


Exi 


(LSC)， 小 单 拷贝 区 (SSC) 和 反 向 


D. SSR 位 点 分 别 在 叶绿体 基因 组 CDS， 


copy), and IR (invert repeat) regions; C. Numbers of SSRs identified in CDS (coding regions), IGS (intergenic 


spacers), and introns of the cp genome; D. Frequency distribution of different types of SSRs identified in CDS, 


IGS, and introns of the cp genome. 


图 3 Mirem RAH SSR 分 析 


Fig.3 SSR analysis of the chloroplast genomes of Paphiopedilum parishii 


2.3 重复 序列 分 析 


利用 REPuter 对 6 条 飘带 兜 兰 叶 绿 体 基因 组 序列 


行 重复 序列 分 析 。 在 6 个 叶绿体 基因 


组 中 均 鉴 定 到 60 个 重复 序列 ， 包括 17~21 个 正 向 重复 (forward repeats); 18-29 个 反 疝 重复 


(reverse repeats); 4~9 个 互补 重复 (complement repeats) 以 及 9~16 个 


回 


文 重复 (palindromic 


repeats) (图 4: A). 6 条 叶绿体 基因 组 重复 序列 的 长 度 范 围 跨度 较 大 ， 但 都 集中 在 30~40 bp 


之 间 (图 


4: B). 
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[ls x € €. Palindromic repeats [9] 反 向 重复 Reverse repeats 
[B] Et Complement repeats [E] 下 向 重复 Forward repeats 
60 >50 30-35 36-40 41-45 46-50 
40 
50 
30 
40 E 
z 
ed Æ 20 


» 
3 


P. parishii 2 
P. parishii 4 


P. parishii 5 
p 


P. parishii 
P. parishii 


A. 不 同类 型 重复 序列 的 数量 ，B. 重复 序列 的 类 型 在 不 同 重复 长 度 中 的 数量 分 布 。 


A. Numbers of repeat sequences in different types; B. Frequency distribution of different types of repeat sequence 


identified in different sizes of the chloroplast. 


图 4 飘带 忽 兰 叶绿体 基因 组 重复 序列 分 析 


Fig.4 Repeat sequences analysis of the chloroplast of Paphiopedilum parishii 


2.4 飘带 忽 兰 种 间 叶 绿 体 基 因 组 序列 的 多 样 性 

以 P parishi 1 为 参考 序列 , 利用 mVISTA 软件 对 6 2& Sum 9g E Hy Jit tT Fr 9 Ze RETE EG 
较 (附录 3)。 结 果 表 明 ，6 RU uH XUI ER E, LSC 区 的 多 样 性 相对 较 高 ， 略 高 于 
IR 区 和 SSC 区 。 多 样 性 水 平 较 高 的 片段 主要 在 非 编 码 区 , 例如 atpH - atpl . psaA - ycf3. atpB 
- rbcL, accD - psal. trnP-UGG - psaJ。 而 编码 区 变异 度 较 低 ,，ycfl 基因 的 变异 度 稍 高 ,tRNA 
FI rRNA 基因 在 飘带 忽 兰 中 极为 保守 。 

6 条 序列 边界 比较 图 显示 ,rp122 ,trnL-U4G ,rps19 以 及 psb4 分 别 位 于 6 条 序列 的 LSC/IRb、 
IR/SSC、IRa/LSC 边界 或 边界 附近 。rp122 位 于 LSC/IRb 边界 上 ， 有 58 bp 的 片段 位 于 IRb 
区 域 ; 重复 基因 trnL-U4G 位 于 IR 区 域内 , 离 IR/SSC 边界 相距 176-186 bp; 重复 基因 rps19 
ALT IR[IX, BiIR/LSC 边界 282 bp: psbA 位 于 LSC 区 ， 离 IRa/LSC 边界 96 bp (附录 4); 

6 条 序列 边界 基因 较为 保守 ， 扩 张 收缩 现象 不 显著 ， 只 有 P parishii_4 的 IR 区 有 微小 扩张 。 


2.5 飘带 忽 兰 种 间 叶 绿 体 基 因 组 核 苷 酸 多 样 性 

通过 对 6 条 飘带 久 兰 叶绿体 基因 组 核 苷 酸 多 样 性 的 分 析 , 发 现 6 条 叶绿体 基因 组 序列 中 
共存 在 10 个 SNPs 以 及 60 个 InDels， 其 中 基因 间隔 区 有 4 个 SNPs，43 个 mhDels， 内 含 子 
区 有 1 个 SNP 和 13 个 InDels， 编 码 区 有 5 个 SNPs 和 4 个 InDels ( 表 3)。 在 10 个 SNPs 中 
9 3 个 发 生 了 非 同 义 蔡 换 ， 导 致密 码 子 改变 ， 分 别 是 在 ?poC1 基因 中 碱 基 A 蔡 换 为 C， 使 
编码 的 氨基 酸 由 异 亮 氨 酸 转变 为 丝氨酸 ; 在 rpoB 基因 中 碱 基 C 替换 为 碱 基 T， 使 编码 的 甘 
氨 酸 转变 为 精 氨 酸 ， 在 ycf4 基因 中 碱 基 G 替换 为 C， 使 编码 的 蛋氨酸 转变 为 异 亮 氨 酸 。 此 
外 还 有 2 SNPs 发 生 同 义 蔡 换 ， 密 码 子 并 未 改变 ， 其 余 SNPs 均 位 于 非 编 码 区 。 我 们 还 对 
大 于 3 bp 的 InDels 进行 了 多 态 性 的 分 析 ， 发 现 共 有 19 个 位 点 呈现 了 种 内 的 多 态 性 CR 4)， 

例如 基因 间隔 区 pasA - ycf3 分 别 在 P. parishii 1. 3. 4 中 发 生 了 插入 ， 而 在 P. parishii 2、5、 

6 中 缺失 ; 而 在 accD 基因 的 编码 区 及 内 含 子 分 别 存在 的 2 InDels 在 个 体 间 也 具有 多 态 性 。 


利用 DnaSP 4l 9E f SUVs 9825 6 个 个 体 的 叶绿体 基因 组 基因 和 基因 间隔 区 的 核 苷 酸 
多 样 性 值 (Pi)， 编 码 区 的 P; 873 0-0.000 61， 仅 有 5 个 基因 的 核 苷 酸 多 样 性 值 大 于 0， 其 中 
ycf4 基因 的 Pi; 值 最 高 ， 基 因 间 隔 区 的 Pi 值 为 0~0.006 32， 仅 有 3 个 基因 间隔 区 的 核 苷 酸 多 
样 性 值 大 于 0， 其 中 rps3 - rp122 的 产值 最 高 (附录 9)， 表 明 球 带 兜 兰 种 内 表现 了 较 低 水 平 
的 核 苷 酸 多 样 性 ， 基 因 间 隔 区 的 核 苷 酸 多 样 性 相对 较 高 。 此 外 ， 分 析 发 现 变异 程度 较 高 的 位 
点 主要 位 于 LSC X, mj IR XF SSC 区 相对 保守 。 
表 3 飘带 忽 兰 叶绿体 基因 组 插入 缺失 统计 


Table 3 Summary of variants detected in Paphiopedilum parishii chloroplast genomes 


插入 缺失 InDels TRECE BRE: SNPs 
总 数 蛋白 编码 区 "e 内 含 子 区 蛋白 编码 区 基因 间隔 区 内 含 子 区 
基因 间隔 区 IGS 
Total CDS Intron CDS IGS Intron 
70 4 43 13 5 4 1 


H 


ik: CDS. 编码 序列 ，IGS. 基因 间隔 区 ;InDels. 插入 缺失 ，SNP. 单 核 背 酸 多 态 性 。 


Note: CDS. Coding sequence; IGS. Intergenic spacer; InDels. Insertion or deletion; SNP. Single nucleotide 


polymorphism. 
K 4 Bii 9p o5 n AREAS RARR (>3 bp) 
Table 4 Characters of InDels (73 bp) in chloroplast genomes of six Paphiopedilum parishii 


individuals 
插入 缺失 大 小 P. parishii 1/P. parishii 2/P. parishii 3/ 位 置 区 域 
InDels size (bp) P. parishii A/P. parishii 5/P. parishii 6 Location Region 
18 0/1/0/1/1/1 trn$-GCU - trnG-UCC IGS 
5 0/0/0/1/0/0 atpF Intron 
273 1/1/1/0/1/1 atpH - atpl IGS 
4 1/1/1/0/1/1 trnE-UUC - trnT-GGU IGS 
19 1/0/1/1/0/0 DsaA - ycf3 IGS 
7 1/0/1/0/0/0 trnT-UGU - trnL-UAA IGS 
4 1/1/1/0/1/1 ndhJ CDS* 
4 0/0/0/1/0/0 atpB - rbcL IGS 
7 0/1/0/0/1/1 atpB - rbcL IGS 
12 1/1/1/0/1/1 accD CDS 
54 1/0/1/0/0/0 accD Intron 
89 1/1/1/0/1/1 accD - psal IGS 
31 1/0/1/0/1/1 trnP-UGG - psaJ IGS 
60 1/0/1/1/0/0 trnP-UGG - psaJ IGS 
4 0/0/0/1/0/0 psbB - psbT IGS 
5 1/0/1/0/0/0 rpll4 - rpll6 IGS 
6 1/1/1/0/1/1 ycfl CDS 
8 0/0/0/1/0/0 ccsA - trnL-UAG IGS 
6 1/1/1/0/1/1 ycfl CDS 


注 : 1 表示 插入 ;0 表示 缺失 。 


Note: 1 indicates insersion; 0 indicates deletion. 


2.6 BU 9025 BRL RR LAC OA 
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通过 PhyloSuite 计算 出 最 佳 碱 基 蔡 换 模型 为 TVM+F+R2， 采 用 此 模型 构建 系统 发 育 树 。 


16 种 够 兰 属 植物 构成 了 支持 率 很 高 (支持 率 均 为 100%) 的 3 个 分 支 ， 其 中 德 氏 兜 兰 (P 


delenatii ) d: 9 9875. (P. armeniacum 白花 忽 兰 (P. emersonii ) Rin] SE = (P. micranthum ) 


构成 了 基部 分 文 ， 归 属于 小 苯 亚 属 (Subgenus Parvisep. 


alum); 文山 兜 兰 (P wenshanense )、 


[H]f& 9875 (P concolor) MEI (P. bellatulum) JE EX — ^H RNS, VA Jg T a EXE Je 
(Subgenus Brachypetalum), H A P ARE ju 25 6 个 个 体 并 未 分 开 ， 形 成 1 个 分 支 ， 与 长 办 


兜 兰 形成 姐妹 群 (图 5)。 


Vj (E Fe = Paphiopedilum helenae MNS87778 
Kt 7 P. tranlienianum MW 794129 
/]NTE 875 P. barbigerum "NC. 050870 
EFJ P. henryanum. MIN315108 
Và JJ L5 P. gratrixianum. MW284890 
HILE P. spicerianum | MT683624 
x uratum NC 045279 
dianthum NC 036958 
CEP parishii OP 604359 
ERGUE P parishii OP 604357 
AIU TE P parishii S MW 528213 
EADE E P parishi MN 587822 
abiur E. parishii 3 Op 603358 
D E OP 604356 
m 


100 


MT648789 
um NC 045278 

NC 041309 

TIE] 75 Cypripedium japonicum K3625630 


分 支 上 的 数值 代表 自 展 值 。 


The numbers above branches represent bootstrap percentage (BP) of 


F= C eateeolus NC. 045400 
TIBIE C tibeticum MN561380 


ML. 


图 5 基于 叶绿体 全 基因 组 序列 最 大 似 然 法 构建 的 系统 发 育 树 


Fig. 5 Phylogenetic tree conducted using Maximum Likelihood (ML) methods based on whole 


chloroplast genomes from different species 


3 讨论 与 结论 


本 研究 利用 二 代 高 通 量 测序 技术 对 球 带 兜 兰 野生 居 群 不 同 个 体 进行 浅 层 基因 组 测序 , 通 


过 组 装 和 注释 获得 到 了 飘带 兜 兰 叶 绿 体 全 基因 组 . 6 个 
序 一 致 ， 没 有 发 生 基 因 组 的 重 排 或 倒 位 事件 。6 个 叶 绿 
分 体式 结构 ， 由 IR 区 、LSC 区 、SSC 区 组 成 (Jansen 


个 体 的 叶绿体 基因 组 的 基因 数量 和 顺 
体 基因 组 均 为 叶绿体 基因 组 的 典型 四 
et al., 2005)。 对 带 忽 兰 的 叶绿体 基因 


组 长 度 为 154 403~154 809 bp, 符合 此 前 报道 的 兰 科 及 兜 兰 属 植物 的 叶绿体 基因 组 大 小 Kim 


et al., 2014; Guo et al., 2021)。 球 带 兜 兰 不 同 个 体 间 的 叶绿体 基因 组 长 度 变 化 主要 在 LSC 区 ， 


为 86 581-86 983 bp， 而 SSC 区 和 IR 区 基本 保持 一 致 ， 
693 bp. IR KRR 他 被 子 植物 有 显著 的 扩张 ，SSC KN 


分 别 为 2 436-2 446 bp 和 32 690~32 
1 有 较 大 程度 的 收缩 ， 仅 包含 rp132 和 


ccsA 2 个 基因 ， 这 些 特 点 符合 哲 兰 属 叶绿体 基因 组 特征 


(Guo et al., 2021)。 与 其 他 已 报道 的 


兰 科 属 种 的 叶绿体 全 基因 组 的 SSC 区 长 度 相 比 ， 例 如 凌 氏 石 豆 兰 (Bulbophyllum lingii, 18 
244 bp). ERAF! (Dendrobium wangliangii, 18 373 bp). EilKW]-5 (Cypripedium japonicum, 


21 911 bp) (Kim et al., 2020; Shao et al., 2020; Tang et al., 


2021)， 兜 兰 属 的 SSC 区 收缩 严重 ， 


导致 整个 基因 组 的 长 度 远 低 于 兰 科 植物 其 他 物种 。 由 于 大 量 SSC 区 的 基因 转移 至 IR 区 , 使 


us paphiopedilum 


Subgeni 


us brachtypetalum 


d> WKE 


Subgenus parvisepalum Subgem 


得 SSC X AAA ERRERA E Ws 9e o p e — egt SSC 区 基因 ,如 ycfl ,psaC、 
ndhD 转移 至 IR X (Kim et al., 2015; Lin et al., 2015; Niu et al., 2017)。 有 研究 认为 由 于 IR [X 
的 基因 可 以 利用 同 源 重 组 机 制 修复 DNA 损伤 ， 较 大 的 IR. 区 域 更 有 利于 质 体 基 因 组 的 稳定 
TE, 因而 基因 的 转移 可 能 更 利于 该 基因 的 表达 (Palmer & Thompson, 1982; Wicke et al., 2011). 
这 种 基因 转移 使 得 兜 兰 属 SSC 区 具有 极 高 多 样 性 ， 序 列 长 度 差 异 大 ， 长 度 为 524~5 913 bp, 
基因 数目 也 显著 不 同 , 其 种 间 多 样 性 和 种 内 的 稳定 性 使 其 具有 开发 成 用 于 物种 鉴定 的 分 子 标 
记 的 潜力 (Guo et al., 2021). 
球 带 兜 兰 的 叶绿体 基因 组 共 编 码 129 个 基因 ， 包 括 78 个 蛋白 质 编码 基因 、39 个 tRNA 
基因 、8 个 rRNA 基因 ， 以 及 4 个 假 基 因 ， 与 此 前 报道 的 相同 (Guo et al., 2021). 4 个 假 基因 
都 是 由 于 大 量 基 因 片 段 缺 失 造 成 功能 丧失 ， 其 中 ndhJ 由 于 片段 缺失 导致 基因 缺少 起 始 密码 
子 ， 而 ndhD 和 ycfl5 的 碱 基 缺 失 $0% 以 上 。 球 带 兜 兰 叶 绿 体 基 因 组 中 存在 大 量 的 ndh 基因 
Ek, RRM T ndhB. ndhD 和 ndhJ]， 其 中 ndhD 和 ndhJ 为 假 基 因 ， 这 也 是 SSC 区 收缩 的 
原因 之 一 。 兰 科 植 物 普 遍 存 在 ndh 基因 的 丢失 现象 (Yang et al., 2013; Feng et al., 2016; Niu et 
al., 2017; Zavala-Páez et al., 2020), 但 ndh 基因 的 丢失 程度 不 同 ， 比 如 石 豆 兰 属 叶绿体 基因 组 
中 仍 存在 12 个 ndh 基因 (Tang et al., 2021), 兰 属 植物 叶绿体 基因 组 中 存在 10 个 ndh 基因 (8H 
国家 , 2020), "E ELS II] ndh 基因 丢失 现象 极为 严重 (FRH, 2017)。 叶 绿 体 ndh 基因 与 核 基 
因 组 部 分 基因 共同 编码 NAD (P) H 脱氧 酶 复合 体 ， 参 与 环 式 电子 传递 链 (CET) 途径 ， 在 植 
物 抗 逆 胁迫 中 起 重要 作用 。 除 了 兰 科 植物 外 , 在 裸子 植物 松 杉 类 和 麻黄 类 中 也 发 现 ndh 基因 
e 的 丢失 (Braukmann et al., 2009; Wu et al., 2009)。 有 研究 认为 ndh 基因 的 缺失 可 能 是 植物 由 
自 养 转 为 异 养 的 进化 过 程 (Lin et al., 2017). 
通过 比较 基因 组 学 分 析 ， 本 研究 在 飘带 忽 兰 6 个 个 体 的 基因 组 中 共 鉴 定 到 103~107 个 
SSR 位 点 ， 其 中 数量 最 多 的 是 单 核 苷 酸 重复 序列 ， 其 次 是 二 核 音 酸 重 复 序列 ， 多 以 A、T 碱 
C 基 为 基本 重复 单元 ， 显 示 了 高 度 的 AT 人 和 偏好， 与 当前 在 被 子 植物 叶绿体 基因 组 中 观察 到 的 
= 情况 一 致 (Qin etal., 2015; WEBSZERU PX, 2022)。 重 复 序列 在 植物 基因 组 中 扮演 重要 角色 ， 
nu 由 于 多 态 性 较 高 ， 在 群体 遗传 和 进化 研究 中 经 党 被 用 来 做 分 子 标记 (Muraguri et al., 2020). 
,一 本 研究 共 筛 选 到 21 个 SSR 位 点 具有 多 态 性 ,这 些 位 点 可 开发 为 分 子 标记 用 于 评估 球 带 兜 兰 
^ 种 群 的 遗传 多 样 性 。 此 外 ， 本 研究 还 发 现 非 编码 区 的 SSR 数量 远 多 于 编码 区 ， 这 说 明 非 编 
码 区 比 编码 区 具有 更 高 遗传 多 样 性 ， 这 可 能 由 于 非 编 码 区 面临 着 更 大 的 选择 压力 (Shaw et 
e al., 2007)。 正 向 重复 、 反 向 重复 、 互 补 重复 和 回 文 重复 在 6 个 个 体 的 叶绿体 基因 中 也 表现 了 
© 多 样 性 。 同 种 植物 长 序列 重复 的 不 同 可 能 由 于 序列 的 插入 缺失 导致 重复 序列 的 类 型 发 生 改 变 ， 
可 能 与 基因 重组 有 关 (Somaratne et al., 2019). 
插入 缺失 和 突变 引起 基因 结构 的 差异 是 遗传 变异 的 重要 来 源 , 代表 生物 个 体 适 应 环境 变 
化 的 能 力 (Han & Xue, 2003)。 种 间或 种 内 的 叶绿体 基因 结构 差异 可 用 于 近 缘 种 间 和 种 内 的 
系统 发 育 关 系 及 群体 遗传 学 研究 (McCauley, 1995; Kersten et al., 2016). ZKWE2UTE SU 980 25 
的 6 个 个 体 的 叶绿体 基因 组 中 鉴定 到 60 个 mDels 和 10 个 SNPs， 主 要 分 布 在 基因 间隔 区 。 
与 其 他 种 内 叶绿体 基因 组 比较 分 析 相 比 ， 球 带 兜 兰 的 InDels 和 SNPs 数量 并 不 多 。Muraguri 
等 (2020) ÆR (Ricinus communis ) 12 个 个 体 的 叶绿体 基因 组 中 共 鉴 定 到 162 个 SNPs 和 
92 个 InDels; Zhang 等 (2020b) fEKER (Quercus acutissima) 3 个 个 体 中 共 检 测 到 77 个 SNPs 
和 255 个 mDels。Alexander 等 (2014) EINER (Q. rubra ) 4 个 个 体 中 鉴定 到 8 个 SNPs 和 
45 个 InDels。 本 研究 共 发 现 19 个 位 点 呈现 种 内 多 态 性 。 通 过 mVISTA 基因 组 比 对 和 核 苷 酸 
多 样 性 (P) 值 的 计算 ， 发 现 非 编 码 区 的 核 音 酸 多 样 性 远 高 于 编码 区 ， 其 中 rps3-rpl22 W P; 
值 最 高 (0.006 32)。 球 带 兜 兰 叶绿体 基因 组 中 存在 的 这 些 基 因 组 的 结构 变异 可 广泛 用 于 种 间 
和 种 内 关系 以 及 遗传 多 样 性 研究 。 
遗传 多 样 性 是 评估 物种 对 栖息 地 环境 适应 能 力 以 及 抗 逆 能 力 的 重要 指标 , 研究 遗传 多 样 


= 


性 和 遗传 结构 是 制定 物种 保护 措施 的 前 提 ( 张 亚 红 等 , 2019)。 通 过 叶绿体 全 基因 组 的 比较 分 
析 ， 本 研究 筛选 出 了 一 些 多 态 性 叶绿体 基因 组 分 子 标记 ， 为 评估 肚 带 兜 兰 的 遗传 多 样 性 ， 探 
讨 系统 发 生 、 进 化 以 及 保护 遗传 学 研究 提供 遗传 学 基础 。 
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附录 1 30 


攻 兜 兰 叶 绿 体 基 因 组 编码 的 基因 


Appendix 1 Gene contents in the chloroplast genomes of six Paphiopedilum parishii individuals 


基因 分 组 


Group of genes 


1 光合 系统 I 基因 Photosystem I 


2 光合 系统 开 基 因 Photosystem II 


3 细胞 色素 复合 物 基 因 Cytochrome b/f complex 


4 ATP 合 酶 基因 ATP synthase 


5 NADH 脱氧 酶 基因 NADH dehydrogenase 


6 二 磷酸 核 酮 糖 羧 化 酶 大 亚 基 


Subunit 


T 


7 RNA 聚合 酶 亚 基 基因 RNA polymerase 


8 核糖 体 小 亚 基 


d 
bs 


9 核糖 体 大 亚 基 基因 Large subunit of ribosome (LSU) 


10 其 他 基因 Other genes 


11 未 知 功能 基因 Proteins of unknown function 
体 RNA 基因 Ribosomal RNAs 


12 核 


D 


13 转运 RNA 基因 Transfer RNAs 


copies; A indicates pseudogene. 


注 : * 表 示 具 有 个 内 含 子 的 基因 ; 


; 


Small subunit ribosome (SSU) 


"ok 


基因 RubisCO large 
š 


有 两 个 内 含 子 的 基因 ; (x2) 有 两 个 拷贝 的 基因 ; A 假 基因 。 


Note: * indicates gene containing one intron; ** indicates gene containing two introns; (x2) indicates gene has two 


基因 名 称 


Gene names 

psaA, psaB, psaC (x2), psal, psaJ 

psbA, psbB, psbC, psbD, psbE, psbF, psbH, 
psbl, psbJ, psbK, psbL, psbM, psbN, psbT, 
psbZ 

petA, petB*, petD*, petG, petL, petN 

atpA, atpB, atpE, atpF*, atpH, atpl 

ndhB * (x2), ndhD^, ndhJ^ 


bcL 


rpoA, rpoB, rpoC1*, rpoC2 
rps2, rps3, rps4, rps'7(x2), rps8, rpsll, 
rps12(x2), 
rps14, rps15(x2), rps16*, rps18, rps19(x2) 
rpl2*(x2), rpll4, rpll6*, rpi20, rpD22, 
rpl23(x2), rpl32, rpl33, rpl36 
clpP**, matK, accD*, ccsA, infA 
ycf1(x2), yof2(x2), ycf3**, ycfA, ycfl5(x2)^ 
rrn4.5(x2), rrn5(x2), rrn16(x2), rrn23(x2) 
trndA-UGC*(x2), | trnC-GCA, | trnD-GUC, 
trnE-UUC, 

trnF-GAA, trnfM-CAU, trnG-GCC, 
trnG-UCC*, 

trnH-GUG (x2), trn]-CAU (x2), 
trnI-GAU*(x2), 

trnK-UUU*, trnL-CAA (x2), trnL-UAA*, 
trnL-UAG (x2), trnM-CAU, trnN-GUU (x2), 
trnP-UGG, | trnQ-UUG,  trnR-ACG (x2), 
trnR-UCU, 

trn$-GCU, trnS-GGA, trnS-UGA, trnT-GGU, 
trnT-UGU, | trnV-GAC (X2), tmV-UAC*, 
trnW-CCA, 

trnY-GUA 


| 


iud 


附录 2 飘带 兜 兰 6 个 个 体 的 叶绿体 基因 组 SSR 位 点 类 型 和 数量 
Appendix 2 Types and amounts of simple sequence repeats (SSRs) identified in the chloroplast 


genomes of six Paphiopedilum parishii individuals 


SSR 类 型 P. parishii 1 P. parishii 2 P. parishii 3 P. parishii 4 P. parishii 5 P. parishii 6 
SSR Type m" ii " " a " 
数目 比例 数目 比例 数目 比例 数目 比例 数 比例 数目 比例 
Number Ration (%) Number Ration (%) Number Ration (%) Number Ration (%) Number Ration (%) Number Ration (96) 
单 核 普 酸 重复 
51 48 4T 46 51 48 47 46 48 46 48 46 
Mononucleotide 
ZIFREN 
20 19 20 19 20 19 20 19 20 19 20 19 
Dinucleotide 
三 核 苷 酸 重复 
15 14 15 15 15 14 15 15 15 14 15 14 
Trinucleotide 
四 核 苷 酸 重复 
14 13 14 14 14 13 14 14 14 13 14 13 
Tetranucleotide 
五 核 音 酸 重复 
2 2 2 2 2 2 2 2 2 2 2 2 
Pentanucleotide 
ZNECH ER HI 
. 5 5 5 5 5 5 5 5 5 5 5 5 
Hexanucleotide 
总 数 
107 103 107 103 104 104 


Total 
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psbA  trnK-UUU . ms-GcU. j F 52 oC2 poB imC-GCAPbM y d 


P. parishii. 3 


" 


P. parishii 4 | ] 


P. parishi 5 I — EENTTNMO 


P. parishii 6 L TT 
0k 2 6 20 k 24 k 28 k 32 k 36 


psaA atpB PSbE imP-UGG clpP zi po pon 
— * pell. -—  — M 
acD psal pet pshJ psbl peiG — psaJ rpsl& rpsi2 psbH 
— ) -— (4 Pit, bob Beo <m- 
vd bL trnW-CCA 3 pL 


P. parishii 2 
P. parishii 3 
P. parishii 4 
P. parishii 5 
P. parishii 6 


40 k Mk 
petB petD rpl6rpss gal Je1s — rml6 
—— MP 


4 一 一 = 
py E Wr trav-GAC 


P. parishii 2 j ] [ T IEEE TIN i e 
P. parishii 3 | i | I 100% 
P. parishii 4 ius 
P. parishii 5 1 I TRI 100% 


P. parishii 6 j n "7T 100% 


30 k no 84 k 88 k 92 k 45 96 k 104 k 
xoi — psaC Ply psaC rps15 yofl tmN-GUUrrnS rm23 tmAUGC — rml6 — yefl5 
>>) ymp (< < 一 


基因 Gene 
外 


m mg 


Ad— A —Àí > J — 
rpslS trnL-UAG. trnL-UAG rpsl2. trnR-ACG. ial-GAU irnV-GAC rps? ndhB tml-CAA ye trnl-CAU — rpsl9 
基因 问 隔 区 CNS De ee Da 


P. parishii 2 
P. parishii 3 


Lud 


参考 序列 为 Paphiopedilum parishi 1. X SX Nin ex t3 
I5. 


With Paphiopedilum parishii 1 as a reference. The X-axis corresponds to coordinates within the cp genome. The 


组 内 的 坐标 。 了 轴 显 示 50%~100% 范 围 内 的 百 分 


Y-axis shows the percentage identity in the range 5096-1009^. 
附录 3 Suns E ERE DSL A Eo 
Appendix 3 Alignment of the cp genome sequences of six Paphiopedilum parishii 


JLB JSB JSA JLA 


P. parishii 1 154 809 bp 


P. parishii 2 154 660 bp 


P. parishii 3 154 809 bp 


P. parishii 4 154 403 bp 


P. parishii 5. 154 689 bp 


P. parishii 6 154, 692 bp 


JLB, JSB, JSA, JLA 分 别 是 LSC/IRb, SSC/IRb, SSC/IRa 和 LSC/IRa 的 边界 。 
JLB, JSB, JSA, JLA refer to junction boundary between LSC/IRb, SSC/IRb, SSC/IRa and LSC/IRa respectively. 
附录 4 Sui 98-5 6 个 个 体 叶绿体 全 基因 组 IR 边界 比较 图 
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Appendix 4 Comparison of LSC, Rs, and SSC boundaries among the six Paphiopedilum parishii 
plastome 
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A. 基因 编码 区 核 背 酸 多样 性 ，B. 基因 间隔 区 核 背 酸 多 样 性 。 
A. Nucleotide diversity (P;) values of coding genes in the LSC, SSC, and IR regions; B. Nucleotide diversity (P;) 


values of intergenic genes in LSC, SSC, and IR regions. 
附录 5 Sr ju ^5 ERAS AE DAL ECEE BR E FEE HOST 2T 
Appendix 5 Comparative analysis of nucleotide diversity values (P;) among the cp genome 


sequences of six Paphiopedilu. parishii individuals 
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